Tipo :
- Informação de Notícias
- Aplicações de Produtos
- Casos de Monetização
- Tutoriais de IA
2024-12-10 15:51:59.AIbase.13.8k
AI2 lança o modelo open source Tülu3, com desempenho comparável ao GPT-4o mini
No campo da inteligência artificial, as técnicas de pós-treinamento estão se tornando cada vez mais importantes para melhorar o desempenho dos modelos. Recentemente, o Instituto de Inteligência Artificial Allen (AI2) lançou a série de modelos Tülu3, um conjunto de modelos de linguagem avançados totalmente open source, com desempenho comparável a modelos proprietários como o GPT-4o-mini. O Tülu3 inclui não apenas os dados do modelo, código e receitas de treinamento, mas também uma estrutura de avaliação, com o objetivo de impulsionar o desenvolvimento de técnicas de pós-treinamento para modelos open source. Tradicionalmente, modelos apenas pré-treinados frequentemente não atendem às necessidades de aplicações práticas de forma eficaz, podendo...

2024-07-24 08:56:49.AIbase.10.5k
Chegou o modelo open source mais poderoso! Llama3.1 supera o GPT-4o com 405B parâmetros
O modelo Llama3.1, lançado pela Meta IA, alcança desempenho comparável aos modelos proprietários de ponta, marcando um avanço significativo na IA open source. Este é um modelo de linguagem grande de nova geração, suportado por uma pilha de treinamento otimizada e recursos de computação GPU em larga escala, apresentando diversos destaques tecnológicos. Inclui extensão de comprimento de contexto para 128K, suporte para 8 idiomas e demonstra capacidades excepcionais em vários domínios de teste. Por meio de um processo iterativo de pós-treinamento, o modelo aprimora continuamente seu desempenho, especialmente em instruções de seguimento, consistência e tradução multilíngue.
